501 0ج ما۷۷ 0۶ 00۲1۱۵1[ 
7 ۰۵۵6۴ ۵۹۰/۸۵۷ 


[62020 6 
۳ ۷۵, 36, 0۰ 6, 1۳69-۷۲2۲, 2023, 0. 695-009 


5 ۲6۵ ] ۲/۱0۸۵ ۱0۸0۵ 00۵۱/۲ ۲۷۷۵۸۵۲ م۱0 ۱:۱۵ ۵ صمتامصصا مامت ۱ 
۵ )0۵۵0۵ اومرتمز۳ مه ممص‌ه۸۵۵۵ ۷۷۵۲۵۱۵۲ 60اه 21۳0 


تم ول رو رمع ۷۱,۲۰ 


۰ ۱) ان 10 ۲۱۵0۲۲ 26-08-02 :۹6661۷60 
مامت که ممتتعفصتاعمظ لممتعصط (2023 .9 رصقل271؟ یگ .۷۲ فتاه 08-11-02 :16۷1560 
۶ عصصصمن ‏ مد ولمطاع ‏ مع1۳. . عصلونا. »ع4ص 1‏ تلمتام . بماه ۷۷ 28-11-02 :۸۵۰0۵0۲۵0 


]0 ۵ ۲۷۷۵/۵۲ 0۴ 0۱۲۵ .۸۵۱۷۹۱5 )عمجم لد1۵)عظزظ عمج وعطم۲02ممخظر 22-02-03 :عمنلمن عاطهلند۸ 
امحتاوطاه طفتاعطظ طه مفتوع۴ 18) :695-709 :(36)6 
6 :]10۵ 


ار ۱۱۱۱۹۹ 


۰ له)ممصصصم 1۱ بجع صرح فصصماماميم کصه)عممرحظا دمص ۱۵۲۱0 عصا که عم مه هیهت م4صنامع مها فصه ممه]تتا 
۷ 10110۷7/60 ,180162560 2۷۵ و۵60 عمه7 6 رمتلهلنامه ما ۵۶ طا«متع ۲2۵10 مطا ما مبال روع620ع0 16۷۷ ]129 عط) 1 
عط ما عص20001 ۱6۷۵1 ۱۷2/۵۲ مضه ماه 004ص ۵ واتلمندن معط وکتوعهاه ما تع۵۳0 ما .تمهت معط م6 10240 ]دامرصا فطا 
۰ هنن ۵۶ عون عطا ود وعمطامعصظ 60و )ومصظ فص ۵۶ عم رقمطامصه توصفجدد عته ععفط رصمتام‌تصنافومع ۵ و7۵ 
,۵6۷ صح عصصتاً 5۵۷۵ 10 860 فص صه فصمتماه عصتتماتجمصظ اتلهین تماه ما ماطهانهبه ومتاناتمم مطا ممتعلتمومن 
۵۵۲ 01295111028 م0صج عصتام‌نلع 10۲ ۵۵0ع ع صهع 8مطامحط عصتصتصه عتقل صمعمصظ ۵ فمطامصظ 201۷70صع2 فطلفتا 
,0۳00۱6101 أمتتاون لصا تهتمصتمه رصمتامالمم آهعمانم‌تنوه رعوتا متاوعصصم 10۲ ممنامجتانه عاه7۷ ۵۴ ووعع۵۴06 م1 .0۱0217 
نا ,وتاصهتان هه اتلمتان ماد ۵۶ جمتات‌متتعاع مطا م6 1620 صهه 05مصاممط بعاوع م4صه رصمتامنلمعص انعم 
0 1۳۲0۵01۵ ۷۵۲۲ 15 16 ۲۵۲۵۲0۲۵ ,1000126 20 11۷۵ عقطا محصصفتصحع0 ۵۴ ۵1و مطا رود فص محطماو(د0ع6ع مقاقنا20 عطاً و2166 
۹ 
م۵ عمصاصتی مط گم فمبله۷ لهمزرمصصریه معط معقصاوع م6 ۳۵۵ طمتهعوع۲ هه فطع ۵۶ حصتج م1 .قعبزر ما فاصه/تااوم 
عصععدظ مها بممتامهم مه 7۷۵۷۵۱۵ ۵۴ 611601 عطا مهعناوع7 ص11 مج 0مطامصظ معا فطا عصتوده ([۷۷۵) «06ه1 بانلدتان 
۰ 6010۵0۳۵۵ 0110201021 2۳0 ر0ظ)2۵ 


1۷۲26۳۵216 2 ۵۹ 


۳۷۲0۵ 1۵۱۵۸۷۵ طقوظ مطا ۵۶ فممامصجتهم باتلفتن مطا مق «مصد ۷۷۵۲ عمط ماقلناملهه ما بطم‌تهعوع1 فتطا 1 
,«(1125) و8ت501 09901۷60 هام برنظ) موم لهمتامعاه رام تفه ب(ر1۳۲) وعمصل‌عقط لقاما عصتلتامطاً ممتاماه 
مامم200ع1ه ب(دنن) ملقممهانو ررت) مصتتمل ررع) صتتفعمامم رها صاتوممعه]۱۷ رها تمد ررقت) تلو 
فمنتله۷ 0۵2۱0۵00120۷6 .(1998-2020) وهع۰۱۷ 23 ۵۶ ۵۵۲100 [2عتافتاهاه مطا صد 0عوفنا ۳۸۵۲۵ (رقو) ماهگلناه 0ه2 (وهن۳) 
ما رلمطامحط ممتاقامهه هه عنام مط) عصتونا ۱ظ .عاناماتاه امعتها وه 6۵۵48۲60 ۷۷۵۲۵ 18067 ۷۲۷۵۵1 6ظ) طاز/ 0عهنا هم 
له میاه فطا متقصصتافی م6 ۵0و ۳72۵ 00طاعصظ ومع حصمع‌صه م1 ,0مصتصصعاع ععع۱ فممتافصتطاصصم عحاوصا ۵۶ دهم 
اصمجمممی همم رتمله۵۷/ 0۶۴ ممهمتموه محارم فطا گه بتانندریت فطا رصفط1. بعرعص ]۷۷/۵ مطا ۵۶ وعباه۷ 
وال۷2 6 مبهممومم 10 ,۵72102660 ۵۵ صط)تدمعله مقوه عمط مصمع‌صهد 168 0مطامحظ هصتععظ 208 روئو7 2021 
۶ دتماتنه ممتاهناله7ه مط مهد ]۷۷۵ فطع حم 0متملنملهه ‏ ومیله۷ مطا طد فمطاعصهر عصتصتصه فلج فص ۲0 
۲ ۱0011160 مه ررظها) تمه متااموطاه صهفمجظر رفاک مه متمناوو صوعصه ۲۵01 برع کصمه‌تاومه مجاهم 
0۰ ۷/۵۲۵ (1۳۲) )صمام1له0ع 
تمه وز(۱ 20 واباعع1 


۰ ۱۵0011۳02 فمط ۷۵0 مرح وق 0مطامجظ عصتعع2ظ فطع مضه 0مصامص مصرممصهه ]ما7/2۷۵ ع ۵۶ هقی عط 1 

عط ۶ صمتاحصتطاحوم 2 و1 صطاتتمعاه عفهها عع مومصه فطع یذ 0مطامصه صمتامع1/1عوهاه عصتععظ مطا عقطا مصتعلتمممن 
ب06721عع ط1 ,90 .0061 1 ما ۵۶ ب«مجتناهعج فطع 1861۵2800 فقط 0مطصامص فنط عصتعتا 50 رقععتا مصمعصه؟ 9۵۷۵۲۵1 0۶ فالناوع۲ 
0 ۲«مدونهممج وعوهعمصا فلمطصامصه ممتاه‌تففهاه مه ممتامممممهه ]۸۷2۵۷۵۱۵ 0۴ موب فط عقط 260تمجمم قه۳۷ .]1 
م0 0۶ 10 متتقصوعو ما ۲۵12)60 ۷/۵5 0۳۲0۲ ۱0۷۷۵۹۲ عط) لمح پمهتنامع2 )معط مطا 6 متتقجهعو ]و۵ عظ1. ,قمع قعع0ع۲ 


هص رمتلنهم‌تبيه که ولنمه۲ رعمتهمصتعصظ بماج ۷۷ ۵۶ اممصص‌ندمعن1 رتصعلنگ ۲:9۵ مضه ۳۶۵16850۲ ۸۵۹0012/6 -2 20 1 
۰ ,1۳217 ,20112 ] ,120112 01 
(۵0۲120.26.16) ۵) تاحفص :تفص ممطننه م مت ممصومتزمن -۶) 
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بصتالم(ه) مماقطماناه بکترم 0۱۷۵0وون لها0] ,مهم لامعا روومصل۳۱2۲ ۰۲۵62 ط 2001 1 ۷۷-۲-16 
1 106 824 0ع7مطه فلناوع: م1 .ععمامصصههم مصاتوعهامم مه رتم رممتاما راتوم‌ممه] ۱۷ رعاهممهايهع1ظ 
۰ 016۲ مق و۱0 06۲60زفههم ود 1206 ]۷۷۵ مطا ۵۶ فلج لههتتمصصبنه فطل عصتاممصتامی صد آص 0۴ ]1۳0026 
0 ۲۱ 0 مبااه۲ موه مطا ۵۶ فلج عطا عمتمنال0ع: اه رلهویا قه 0مطاممه فتورلفمه ممممم‌مصمی لهموتمصتن فط م۷۷ 
موه عطا مج 6160160 ۷۷۵۲۵ 12010015 ۳۲٩‏ 20 و۲2 با۲ 0یرالناعع۲ 2 فظ :060268860 معله ۲ماعع مطا ۵۶ عبالج۷ عظ) ,۲12 
,۷۲۸۳<1.52 ,۴(۷]9۳<2.17 ,520.98 مه ۵0«مامرجصه مصمل قه عصتام0مصه رقتمامه؟ متفه 3 مصلتم0تفممن .عاممصمم‌طمم 
جصمصن مطا عمتمن0ع۲ مالموع0 رل‌مطامصه ۳۸ مطا )2ظ) 0760و فعلناوع۲ مطا رلمتعصعع ما .مصتهاتاه ۷۷۵۲۵ 1۲(۲20.97 208 
معط 25 100۳000660 ور 20 ۵061 عطا ۵۶ 5۵60 20 ب«20تتا0ع2 عط 1۳00۲0۷۵ صق با عصانامرصته 0صه وعماعع۷ عبامرط1 فص ۵0 

۰ ۷۷۵۲۱ 66 0۶ فلج لهع1مصصباه مطا عصتامصتاوع ۲۵۲ 0مطامحظ )وم 

«متعصل‌صم) 


۸۵ 2204 وصلعودظ بممصه امل۳/۵۷۵ ۵۴ عونا مطا قطا 06۵0و جامعوع۲ عصعوععم عط) م۳0 0مصتهاداه و)لناوع2 فط 1" 
معط عصتمططتاوی ص1 .رمحتهعج مطتمطعنط مصتفمه‌عمصا مه فالنافی: معط مماهم۲ رما وم امعه ۵910۷۵ 2 ۳20 005ظ)عظظ 
اممماههه ممتاهلمهه طه رقتمامع صتقصظ 3 ممتملنفوم 0مطامصر .]۲۳۸۵-۲-1 برع120 ۷۷۵۵ ۵۶ ما۷2 2۱۱۵۲1621 
0 ۲۲۳۵6 20 1.52 ما لمتامع مه مبتلج۷ ماباموهاه عمهره2۷ ,2.17 ما لذناوع مه عتقنا50 مومع ]۲۵۵ ,0.98 6۵ لقناوم 
عمط صا 860 05مطامصه فطا له عقط عممعمومن .ممنهمع. )فعطونط مط 24ظ 0.97 6۵ لهیدوع عصعت‌طهمع )ما۷۷ 
0 260655 01 1201 0هه 0202 0۶ 1201 01 موه صا ر61۵10۲۵ ,رمهتتا0ع2 2660002010 20 وماله۷ ۷۵ تاماتاممتو ۶ ممتتفصتاهم 
۶ رنه 0ماتصصتا ه مصتمت ها فااتاوع مامماوععع2 مضه 20010010266 صتقاهاه ما ماطاتووم و1 16 رقتمامصصهتهم لههتصصمطل 21 
۰ ۶ ۱۵)۱00ظ عصتصتحط ماه 20 فهامصصهت22 

ر755 2021 )صمصمم‌صرمم ههام۳۳ باصمله‌تللهمه )ما۷۷ ۷۱۵060 رطمهمومه مطتووهءمتممتم عصلععدظ :1۵۲۱۷۵۲۵9 
۵ ۷۷2۸۷۵۱۵ ,ما تتمعاخ عنام 


۳ 
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جلد ۰۳۶ شماره ۶ بهمن-اسفند ۱۴۰۱ ص. ۶۹۵-۷۰۹ 


تخمین عددی شاخص کیفی آب شرب با استفاده از روش‌های درختی و رویکردهای ترکیبی 
موجک و تحلیل مژلفه اصلی 


محمد تقی ستاری 2 سحر جاویدان۲ 


تاریخ دریافت: ۱۴۰۱/۰۶/۰۴ 


تاریخ پذیرش: ۱۴۰۱/۰۹/۰۷ 


چکیده 


آگاهی از کیفیت آب یکی از نیازهای مهم در برنامه‌ریزی» توسعه و حفاظت از منابع آب برای مصارف مختلف از جمله شرب به شمار می‌رود. 


استفاده از روش‌های مدرن داده‌کاوی» می‌تواند رویکرد مناسبی برای پیش‌بینی و طبقه‌بندی کیفیت آب باشد. در پژوهش حاضر» برای محاسبه شاخص 
کیفی آب شرب از پارامترهای شیمیایی شامل سختی کل, قلیائیت» هدایت الکتریکی, کل مواد جامد محلول» کلسیم. سدیم منیزیم. پتاسیم» کلره 
کربنات» بی‌کربنات و سولفات ایستگاه هیدرومتری باغ کلایه استان قزوین» در دوره آماری ۲۳ ساله (۲۰۲۰-۱۹۹۸) استفاده شد. روش درخت تصادفی 
برای تخمین و مدل‌سازی مقادیر عددی شاخص کیفی آب شرب براساس ترکیب‌های مختلفی از پارامترهای شیمیایی به کار برده شد. ماتریس 
همبستگی و الگوریتم رلیف مبنای انتخاب ترکیب‌های مختلفی از پارامترهای شیمیایی به‌عنوان ورودی روش‌های داده کاوی در قالب سناریوهای مختلف 
در نظر گرفته شدند. در جهت بهبود نتایج تخمین عددی شاخص کیفی آب شرب از رویکردهای تبدیل موجک. دسته‌بندی مدل‌ها و تحلیل موّلفه اصلی 
استفاده شد. بررسی نتایج نشان داد که ترکیب ۳ روش تحلیل مولفه اصلی (با در نظر گرفتن ۲ عامل اصلی)» رویکرد پیش‌پردازش 28282112 و درخت 
شده برابر با ۰۷ می‌تواند دقت بالایی در تخمین مقادیر عددی شاخص کیفی آب شرب داشته باشد. براساس نتایج کی به دست آمده» در صورت کمبود 
نمونه‌های آزمایشگاهی و يا عدم دسترسی به تمام پارامترهای شیمیایی» روش‌های معرفی شده در این مطالعه. به علت دقت بالا جهت تخمین شاخص 


کیفی آب شرب قابل توصیه خواهند بود. 


واژه‌های کلیدی: الگوریتم رلیف» تبدیل موجک» تحلیل موّلفه اصلی» رویکرد پیش‌پردازش 3282108 ضریب ویلموت اصلاح شده 


مقدمه 


آلودگی آب‌های سطحی و زیرزمینی از مهم‌ترین معضلات جهان 
و نگرانی‌های زیست محیطی محسوب می‌شود. در چند دهه اخیر 
به‌علت رشد سریع جمعیت. نیازهای آبی و به دنبال آن بار آلودگی 


۱ و ۲- به‌ترتیب دانشیار و دانشجوی کارشناسی ارشد منابع آب» گروه علوم و 

مهندسی آب دانشکده کشاورزی, دانشگاه تبریزه تبرین ایران 

(*+- نویسنده مسئول: ۵0112161۲] ۵) ۹2))۵۲) :اتف 
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ورودی به منابع آب افزایش یافته‌است. جهت طبقه‌بندی کیفیت آب با 
توجه به نوع مصرف روش‌های متعددی وجود دارد که یکی از 
روش‌های پر کاربرد» استفاده از شاخص‌های کیفی است. با توجه به 
کمبود امکانات در تمامی ایستگاه‌های رصد کیفیت آب و نیاز به صرفه 
جویی در زمان و هزینه» استفاده از روش‌های جایگزین مانند 
روش‌های مدرن داده‌کاوی می‌تواند رویکرد مناسبی برای پیش‌بینی و 
طبقه‌بندی کیفیت آب باشد (2012 ,طعه1 224 ه12۷11). فرآیند 
معدنی» تولید برق و غیره می‌تواند منجر به بدتر شدن کیفیت آب شده 
و بر اکوسیستم آبی تأثیر منفی بگذارد. بنابراین ارزیابی کیفیت آب‌های 


۸ نشریه آب و خاک. جلد ۰۳۶ شماره ۶ بهمن - اسفند ۱۴۰۱ 


سطحی در مدیریت آبی-محیطی و در پایش غلظت آلاینده‌ها در 
رودخانه‌ها بسیار حائز اهمیت است. بررسی منابع نشان می‌دهد؛ 
تحقیقات زیادی در زمینه تخمین کیفیت آب‌های سطحی و پیش‌بینی 
شاخص کیفی آب با استفاده از روش‌های داده‌مبنا در سطح ملی و 
بین‌المللی انجام یافته است. سلیمان‌پور و همکاران ( امحمصنعاه6 
8 ,41 6) برای تعیین موثرترین عامل کیفیت آب آشامیدنی 
دشت کازرون, از تکنیک داده‌کاوی درخت تصمیم ۸3۲۲ استفاده 
کردند. نتایج مطالعه آن‌ها نشان داد که دو پارامتر کل جامدات محلول 
و فقذار کلسیم بر کیفیت آب آشامیلتی» تاثیر پیشتری داشته است که 
علت آن را ساختار سازندهای زمین‌شناسی منطقه و وجود کربنات 
کلسیم در ترکیب آن‌ها دانسته‌اند. باتور و مکتاو ( 224 876 
09 ,۷۵127) کیفیت آب‌های سطحی را در دریاچه گالا کشور 
ترکیه با استفاده از فیوژن تصاویر ماهواره‌ای بر اساس روش تحلیل 
موّلفه اصلی» ارزیابی نمودند. آن‌ها پس از انجام تجزیه و تحلیل‌های 
لازم. نتیجه گرفتند که روش رگرسیون سطح پاسخ (85101) مبتسی 
بر ۳6۸ نسبت به مدل‌های داده‌کاوی ۳ ۸۱۷۳۳ و 5۷2/۶ 
برای تخمین دقیق پارامترهای کیفیت آب در دریاچه‌ها برتری دارد. 
آل مختار و آل یاسین (2019 ,۷2:66 -۵۸۱ 4صه تمط۱۷۵۱ -آه) با 
استفاده از مدل‌های داده‌محور. پارامترهای کیفیت آب را مدل‌سازی 
کردند. آن‌ها روش "۸۳15 را به‌عنوان یک مدل پیش‌بینی‌کننده 
برای "115 و ۳6 در عراق پیشنهاد کردند. همچنین نتیجه گرفتند 
که نیترات» کلسیم. منیزیم» سختی کل (1۲1)» سولفات و کلرید. 
تأثیرگذارترین ورودی‌ها در 105 و کلسیم. منيزيم سختی کل 
سولفات و کلرید بیشترین تأثیر را روی 36 دارند. حسینی و همکاران 
(2019 ,.41 0 نصنعهد110) برای ارزیابی کیفی آب سطحی استان 
سیستان و بلوچستان» شاخص کیفیت آب (۱۷0۵1) را به کار بردند. 
ننایج تحلیل‌های آماری انجام شده مشخص کرد که همبستگی میان 
پارامترهایی مانند کلیفرم. نیترات» سولفات و کلر با شاخص کیفیست 
آب. زیاد بوده است. اتهمان و همکاران (2020 ,۵1 6۶ صمحطط0) به 
پیش‌بینی شاخص کیفیت آب رودخانه با در نظر گرفتن حداقل تعداد 
متغیرهای ورودی پرداختند. نتایج بیانگر توانایی استثنایی مدل شبکه 
عصبی مصنوعی برای محاسبه "۷۷۵ بود. همچنین آن‌ها اکسیژن 
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محلول ((70) را به‌عنوان موّثرترین پارامتر در تعیین کیفیت آب 
معرفی کردند. نیهالانی و مروتی (2020 ,۱۷۲66۶۲6۷ 4صد تصدهطنل) 
شاخص کیفیت آب رودخانه‌های اصلی در گجرات هند را ارزیابی 
نمودند. نتایج مطالعه آن‌ها نشان داد که مقدار شاخص کیفیت آب 
برای رودخانه ماهی ۳۰ تا ۵۰ برای رودخانه سابارماتی ۴۲ تا ۶۵ 
برای رودخانه نارمادا ۲۸ تا ۵۲ و برای رودخانه تاپی ۲۵ تا ۷۰ است. بر 
اساس ]۰۷۷۵ استنباط کردند که دلیل اصلی کاهش کیفیت آب 
رودخانه. تخلیه فاضلاب» پساب صنعتی و رواناب شهری بوده است. 
چن و همکاران (2020 .4 ۰ 60)) به تحلیل مقایسه‌ای عملکرد 
پیش‌بینی کیفیت آب سطحی در چین و شناسایی پارامترهای کلیدی 
آب با استفاده از مدل‌های مختلف یادگیری ماشین بر اساس داده‌های 
بزرگ پرداختند. آن‌ها برای پایش کیفیت آب در آینده و ارائه هشدار 
به موقع کیفیت آب» روش درخت تصمیم" جنگل تصادفی" و 
آبشار عمیق "۲ را در اولویت قرار دادند. خوی و همکاران ( 67 مک 
2 .) برای پیش‌بینی شاخص کیفیت آب در رودخانه لا بوونگ 
ویتنام» از مدل‌های یادگیری ماشین استفاده کردند. نتایج تحقیق آن‌ها 
نشان داد که مدل تقویت گرادیان شدید" (200050) با 120.989 
و 8۷]5۳-0.107 عملکرد خوبی در پیش‌بینی ۷۷۵1 داست. 
یافته‌های آن‌ها این استدلال را تقویت کرد که مدل‌های یادگیری 
ماشین, به ویژه 260120051 ممکن است برای پیش‌بینی ۷۷۵۵۲ با 
سطح بالایی از دقت» مورد استفاده قرار گیرند و مدیریت کیفیت آب را 

هدف پژوهش حاضر محاسبه مقادیر عددی شاخص ۷۷۲۵ با 
استفاده از داده‌های مربوط به پارامترهای کیفی آب ایستگاه 
هیدرومتری باغ کلایه در استان قزوین در دوره آماری ۲۳ ساله 
(۲۰۲۰-۱۹۹۸) است. مقادیر عددی این شاخص با استفاده از روش 
درخت تصادفی» تخمین زده شده و قابلیت رویکرد پیش‌پردازش 
2221782 تبدیل موجک تحلیل مژلفه اصلی نیز در جهت بهبود 
نتایج مدل‌سازی مورد بررسی قرار گرفت. 


مواد و روش‌ها 
منطقه مورد مطالعه و داده‌های مورد استفاده 


استان قزوین در بخش شمال غربی کشور ایران واقع شده و 
مساحت آن حدود ۱۵۸۲۰ کیلومتر مربع است. باغ کلایه» روستایی از 
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توابع بخش رودبارالموت شهرستان قزوین در استان قزوین است. 
ایستگاه هیدرومتری باغ کلایه در عرض جغرافیایی ۳۶ درجه و ۲۳ 
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تا ی 


2-0 
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ما6 
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ارتفاع ۱۲۸۷ متر از سطح دریا واقع شده است. موقعیت مکانی ایستگاه 
مورد مطالعه در شکل ۱ آورده شده استت: 


۰۳1 2/۳ ِ«آ۹"«آى«آ" 


شکل ۱- موقعیت مکانی ایستگاه مورد مطالعه 


جمناهاه 500160 عظ) ۵۴ ما1 -1 ۲12۱۲۵ 


جدول ۱- مشخصات آماری پارامترهای مورد استفاده 


۵۵۵۵ 60 جعصصم | مرحصا ۵ معتاعها هل تناها -1 م1201 


معیارهای آماری ضریب تغییرات 
دنمان ام‌ناهناهاه «منادنید۷ صعن‌تلاه) 
سختی کل (میلی‌گرم بر لیتر) 0210 
(انلعص 1۳۲ 
قلیاییت 0042 
ِ 
هدایت الکتریکی (میکروموس بر سانتی‌متر) 0211 
(ه/مطص بر عظ ۱ 
کل مواد جامد محلول (میلی‌گرم بر لیتر) وور 
(1 وه 105 ۱ 
کلسیم (میلی اکی‌والان بر لیتر) 02۹4 
(ا .60 0 
سدیم (میلی اکی‌والان بر لیتر) 0528 
را .0ع) ۲۵ 
منیزیم (میلی اکی‌والان بر لیتر) 
۰ 0436 
پتاسیم (میلی اکی‌والان بر لیتر) 0839 
(1 .۳60 1 
کلر (میلی اکی‌والان بر لیتر) 
(نا .660 0 ِ- 
کربنات (میلی اکی‌والان بر لیتر) 9808 
(ا.معص دمن 
سولفات (میلی اکی‌والان بر لیتر) 039 
(ا .ومع +50 
بی کربنات (میلی اکی‌والان بر لینر) 0242 


۲۱00۵5 )60. 1( 


ماه ۷ «ومو 
باع کلایه یه نله 
۳۳ 9و 
واریانس ‏ میانگین ‏ حداکثر حداقل 
۱ یات ه] ۰۰.۷ صتصا 
۰-8 ۰ 92-25( 10 95.00 
011 1.83 5.40 4.50 
07 2,2" 1048.00 279.00 
1 ۰" 388.05 663.00 186.00 
2024 334 159.80 0.00 
9295 1126 60409 046 
0.9370 2218 29.20 2.76 
2.19 199 1950 039 
198.61 236 89.0 0.00 
17 0.21 33.00 000 
09-_ ۰ 1-1-9-2 2198 22.8 
۰-21 163-0 32312 50.02 


۰ نشریه آب و خاک. جلد ۰۳۶ شماره ۶ بهمن - اسفند ۱۴۰۱ 


در پژوهش حاضر برای محاسبه شاخص ۷۷۵۵1 از پارامترهای 
کیفی ایستگاه هیدرومتری باغ کلایه شامل سختی کل (1۳1) 
قلیائیت (0۳9) هدایت الکتریکی (30, کل مواد جامد محلول 
(7۳5)» کلسیم (6» سدیم (18(» منیزیوم (0۷8 پتاسیم (16 
کلر (01) کربنات (:00)» بی کربنات (۳10۵5) و سولفات (504) در 
دوره آماری ۲۳ ساله (۲۰۲۰-۱۹۹۸) استفاده شد. مشخصات آماری 
متغیرهای مورد استفاده در جدول ۱ ارائه گردید. 

مقادیر کمی محاسبه شده با شاخص ۷۷۵۲ به‌عنوان خروجی‌های 
هدف مدل درخت تصمیم درنظر گرفته شدند. با استفاده از روش 
رلیف "و همبستگی انواع ترکیب‌های ورودی مشخص گردید. این 
ترکیب‌ها در جدول ۲ نشان داده شده است. کیرا و رندل ( 20 16172 
2 11600611) استفاده از الگوریتم رلیف را که یک الگوریتم 
انتخاب ویژگی برای کاهش ابعاد مسئله پیشنهاد دادند. این الگوریتم 
نکات قوتی دارد که می‌توان به ساده بودن اصول و عدم پیچیدگی آن» 
قبل حل بودن با توابع چندجمله‌ای مرتبه پیین»قابل استفاده بودن 
برای داده‌های پیوسته و نیاز به تعداد کم داده‌های آموزشی اشاره کرد. 
در یک مجموعه داده با تعداد لا نمونه (داده مشاهداتی) و تعداد ۲ 
ویژگی که مربوط به دو طبقه مختلف هستند. هر ویژگی باید در بازه 
(۰,۱) قرار گیرد. الگوریتم مذکورء 70 بار تکرار شده و در هر مرتبه از 
یک بردار وزنی متفاوت که از صفر شروع می‌گردد. استفاده می‌کند. در 
هر تکرار, الگوریتم مذکور بردار ویژگی >۸ را که متعلق به یک نمونه 
تصلدفی است و بردارهای ویژگی نزدیک‌ترین نمونه به نمونه ۶ در 
طبقه مورد نظر را توسط تابع فاصله اقلیدسی " انتخاب می‌کند. پس از 
0تکرار, هر یک از عناصر بردار وزن توسط 1 تقسیم‌بندی می‌شوند. 
نتیجه این عمل این است که یک بردار مرتبط به دست مت ایبته 
چنان‌چه مقدار بردار مرتبط یک ویژگی, از آستانه تعریف شده بیشتر 
گردد» آن ویژگی انتخاب می‌گردد. از بین داده‌های موجود ۷۰ / برای 
واسنجی و ۲۰ / برای صحت‌سنجی در نظر گرفته شدند. 

برای برآورد مقادیر عددی شاخص ۱۷۵1 از روش درخست 
تصادفی " استفاده شد. سپس قابلیت رویکرد پیش‌پردازش 13222106 
تبدیل موجک و تحلیل مولفه اصلی ارزیایی شد. 


روش‌های مورد مطالعه 
شاخص کیفیت آب شرب 

از زمان هورتون در سال ۱۹۶۵ بسیاری از نویسندگان به دنبال 
تجمیع متغیرهای مختلف توصیف‌کننده وضعیت آب در یک مقدار 
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مختلف در نظر گرفته شده است. هدف ۷۷۵۵۲ طبقه‌بندی آب‌ها نسبت 
به ویژگی‌های بیولوژیکی. شیمیایی و فیزیکی است که کاربردهای 
(2011 .۸1 ۶۶ ان121). برای اين منظور» متغیرهای تحلیلی باید 
موزون و تجمیع شوند. [۱۷0۵ها را می‌توان به‌عنوان مدل‌هایی از 
کیفیت آب در نظر گرفت. 

در مقاله حاضرء شاخص کیفیت آب شرب با استفاده از فرمول‌های 
۱ تا ۲ محاسبه گردید. در این فرمول‌ها ۷ وزن مربوط به هر پارامتر 
با توجه به اهمیت آن در شرب و ۷۷ وزن نسبی هر پارامته ) غلظت 
هر پارامته 5 غلظت استاندارد هر پارامتره 9 رتبه کیفی هر پارامتر و 
1 نیز شاخص کیفی آب شرب می‌باشد (1992 طعِصذ). 


)0۳ رو 


(۲ 9 
100 اج 0 


۱۷0۱ - ۱ ۳ 


مقادیر ]۷۷۵۵محاسبه شده معمولا به پنج دسته آب عالی» خوب 


روش درخت تصادفی 

درخت تصادفی یک طبقه‌بندی کننده تحت نظارت است و از یک 
ایده جمع‌آوری برای تولید مجموعه‌ای تصادفی از داده‌ها برای ساخت 
که طبقه‌بندی‌کننده, درختان تصادفی بردار وبژگی ورودی را می‌گیرد. 
آن را با هر درخت در جنگل طبقه‌بندی می‌کند و برچسب کلاسی را 
که اکثریت «رای» را دریافت کرده است. به‌عنوان خروجی به ما می 
دهد. در مورد رگرسیون» پاسخج طبقه بند ی کننده» میانگین پاسخ‌ها در 
تمام درختان جنگل است. همه درختان با پارامترهای یکسان اما در 
مجموعه‌های آموزشی متفاوت آموزش داده می‌شوند صطهترهزض) 
(2021. برای ساختن یک درخت تصادفی» سه انتخاب اصلی وجود 
استفاده در هر برگ و روش تزریق تصادفی به درختان. یک تکنیک 
رایجی که برای معرفی تصادفی بودن در یک درخت می‌توان به آن 
اشاره کرد؛ ساخت هر درخت با استفاده از یک مجموعه داده بوت 


استرپ یا زیر نمونه‌برداری است. 
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جدول ۳- پارامترهای دخیل در هر سناریو و روش انتخاب سناریوها 
کمک ماع ۵۱و ۵۲ 0م)مجه مها ره متتقصهیه مهم ۱۲0۷۵۵0 کنرم۵29۳2۳006 1106 -2 12016 


شماره سناریو ورودی روش انتخاب سناریو 
(۵۲حاصصت ۱ متحقصععع) (اساحوص) (0مطاعصر متاععهو متتقصعع) 
1 1۳ 2 جمتافآهجمن 
2 0 ,۲۳۲ 
3 وا ,۲ ,1۳۲۲ 
4 04 ,۲125 ,۲0 ,1۳۲۲ 
5 2 ,80 ,۲125 ,۲ ,1۳۲۲ 
6 ۲0 مهن ,وم ,1۲2 ,۲ ,]1۳۲ 
7 ۷8۵ ,۳۱0/0۵5 به) ,90 ,۲15 ,۲ ,1۳ 
8 ال ,۷۲۵ ,۳۱00 بهن) ,۹0 ,۲۱25 ,۲ بآ1۳۲ 
9 2 1 ,ع۱۷ ,۲1/۵ مه ,و۹0 ,وتا ,۲ بل1۳ 
10 > مها بل ,ع۷ ,و10 م2 م90 ,11۳ ,۲ ,1۳ 
11 09 ,> بقل بلل) ,ع1۷ ,۲1۳/6 بهن) ,و90 ,دنا ,ظ بلا1 
12 :0 یک بهل بلل) ,ع۷1 ,100 مهن م90 ,11۳9 ,۲ ,1۲ 
13 م11" 16۲ 
14 04 ,6 ,111 
15 8 ,م90 بک ,۲۳" 
16 0 ,۲129 ,رم بکا ,1۳ 


جدول ۳- طبقه بندی کیفیت آب بر اساس ارزش ۲۷0۵۲ 
۶ ۲۷۲۷0۲ 07 02560 «0م)1گاععقل زاتلفتان ۲۲۷۲26۲ -3 12016 
(طبقه‌بندی کیفیت آب آشامیدنی) 
نت0 ۷۷2/۵ عصتامتظ۱ ۵۴ جمنایگتععدن 


دامنه 1801 کلاس نوع آب 
(0ع۳۴۵ ۵۲ ۷۷) (وععت) (۷۷۵1۵ 0۲ ۲۷۵6) 
0 610۷ (زیر ۵۰) 1 عالی (۷۷۵۸6۲ ]0ع6۵11ظ۳) 
50-0 1 خوب (۷72167 000)) 
100-200 11 ضعیف (۷۷267 ۳۵۵۲) 
200-00 1۷ خیلی ضعیف (۷۷۵16۲ 000۲ ۲۷۵۲۲) 
۳ ِ 1 (بالای ۷ غیر قابل شرب (عطتصنیل 10۲ ماطم‌تاعصا 216۲ ۷۷) 


به این ترتیب» هر درخت در جنگل. بر روی داده‌های کمی 
متفاوتی آموزش داده می‌شود. که تفاوت‌های بین درختان را معرفی 
می‌کند (2014 ,.۵1 6۶ انجعظ). 


روش دسته‌بندی 

این روش چندین بادگیر پایه به‌صورت موازی به هم متصل می‌شوند 
تا واریانس مجموعه کاهش یابد. هر یادگیر پایه با استفاده از الگوریتم 
یادگیری یکسان بر روی یک نسخه بوت استرپ" آموزش می‌بیند. 
مجموعه داده بوت استرپ» مجموعه‌ای است که به‌طور تصادفی و 
همراه با جایگزینی تمام اطلاعات مربوط به یکی از افراد جمعیت 
مرجع» استخراج می‌شود. این فرآیند تازمان یکسان‌شدن تعداد 
مشاهدات مجموعه جدید با جمعیت مرجع ادامه پیدا می‌کند. به‌دلیل 
دادن شانس انتخاب مجدد به هر نمونه از جمعیت اصلی» ممکن است 


1- 00 


برخی از نمونه‌های جمعیت مرجع» چندین بار در یک مجموعه بوت 
استرپ ظاهر شوند؛ اما برخی دیگر اصلا انتخاب نشوند. تعداد 
مشاهدات» در بوت استرپ‌ها یکسان است؛ ولی هر مجموعه بوت 
استرپ از دیگری متفاوت خواهد بود (2017 ,.۵1 6 ن6:۵024ط1). 
خروجی‌های این یادگیرندگان پایه با رأی اکثریت (برای طبقه‌بندی) یا 
میانگین گیری (برای رگرسیون) برای به‌دست آوردن خروجی نهایی 
جمع می‌شوند چتان چه یادگیرندگان پایه در یک گروه دقیق و متنوع 
باشند. می‌توان به عملکردی بهتر و قوی‌تر دست یافت. در ادبیات علم 
داده و داده‌کاوی روش دسته‌بندی یا 1۸88108 یکی از روش‌های 
یادگیری جمعی" است. منظور از روش دسته‌بندی با ۳۵282108 
میانگین‌گیری از نتیجه پیش‌بینی چندین روش طبقه‌بندی است تا 
دقت پیش‌بینی‌ها افزایش یابد (1996 ,حفصنه:ظ). 


تبدیل موجک 

موجک" دسته‌ای از توابع ریاضی» برای تجزیه سیگنال پیوسته به 
مولفه‌های فرکانسی آن است. در تبدیل موجک» سطح تفکیک هر 
موّلفه برابر با مقیاس آن در نظر گرفته می‌شود. تبدیل موجک تجزیه 
یک تابع بر مبنای توابع موجک است. موجک‌ها که به‌عنوان موجک 
های مادر شناخته می‌شوند؛ نمونه‌های انتقال‌یافته و مقیاس‌شده یک 
تابع (موجک مادر) با طول متناهی و نوسانی شدیدا میرا هستند. تابع 
موجک تابعی است که دو ویژگی مهم نوسانی بودن و کوتاه‌مدت 
بودن را دارد (1995 ,۷۷۵۵۵ 2001 20]). موجک هار یکی از ساده 
ترین روش‌ها و موجک متعارف پرکاربرد با پشتیبانی فشرده است که 
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از نظر ریاضی در بین همه خانواده موجک‌ها ساده است. موجک هار 
بر اساس جفت توابع تکه‌ای ثابت» ساخته شده است که به راحتی 
برای توابع موجک و مقیاس است. همچنین متعامد بودن» پشتیبانی 
فشعرده و پراکندگی ماتریس‌ها از دیگر ویژگی‌های موجک هار در نظر 
گرفته می‌شود (2021 ,.۵1 ۶۶ 15۳۷/2۵/5 ۷). در پژوهش حاضر از 
تبدیل موجک هار استفاده شده است. تعداد موجک هار ایجادشده 
تبعی از عدادپاامترهای ورودی مدل می‌باشد. به‌عنوان مشال وقتصی 
تعداد پارامترهای ورودی چهار تا باشد» در آن‌صورت به تعداد ۴ مورد 
ایجادشده برابر ۸ خواهد بود. به عبارت دیگر تعداد موجک هار توانی 
از ۲ در نظر گرفته می‌شود (1910 ,:۳1۵۵). 


روش تحلیل موّلفه اصلی 
تحلیل موّلفه اصلی از جمله روش‌های آماری چند پارامتریست که 
با برقراری یک ارتباط خطی بین ویژگی‌های متفیرهای ورودی اولیه 
مدلء از حجم اطلاعات ورودی کاسته و موّثرترین بردارهای با ضریب 
همبستگی صفر را انتخاب می‌کند. یک مولفه اصلی را می‌توان به 
صورت زیر نوشت. 
26 ره +۸ ۵ ۳۴0 


۳ بر ۵7 + ۵3 +۸ نه ع ر۳6 


۳0, < 0 4+ 0 

در روابط فوق پارامترهای ,۳0 تا ۳۶۸ تعداد مولفه‌های اصلی. 
4 ضریب [ آمین مولفه اصلی و زآمین متفیر را نشان می‌دهند 
(2010 م,فح۱1112 ۷۷ 20 ت0طض). 

در تکنیک ۳0۸ با استفاده از یک تبدیل خطی. داده‌ها از داده 
های چندبعدی به مختصات دیگر منتقل می‌شوند. این انتقال بر 
اساس حداکثر واریانس و حداقل ارتباط انجام خواهد شد. بدین منظور 
ابتدا ماتریس کواریانس داده‌ها تشکیل شده و سپس مقادیر ویژه و 
بردارهای ویژه ماتربس استخراج گردیده و مرتب می‌شوند. سرانجام, 
چند بردار ویژه که بیشترین میزان مقادیر ویژه را دارند نگه داشته 
شده و بقیه حذف می‌شوند. کاهش داده سبب سادگی مدل پیشگو 
شده و زمان پردازش داده‌ها نیز کمتر خواهد شد (,.21 6 ۵۷ 1۵6 
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معیارهای ارزیابی 

برای مقایسه مقادیر به دست آمده از روش‌های داده‌ کاوی با 
مقادیر محاسبه شده از شاخص ۷۷۵۵۲ از معیارهای ارزیابی ضریب 
همبستگی (4/8 ريشه میانگین مربسات خطا" (0518)» میانگین 
خطای مطلق " (1۷۲۸۳) و ضریب ویلموت اصلاح شده" (1۱۶) استفاده 
شد. فرمول‌های آماره‌های فوق به ترتیب در روابط (۵) تا (۸) ارائه 


گردیده است: 
بتحت. ۸ 
(- )بت ۳ 
(۵ ۳ 
بت ۷7 ۳ ۷ 
([- زار ( - 0 
۳ 1-1 
( 
9 
۸۷ 
۸ ِ 
) ( ند 0 5 ۷" #۷ 
یل داز 
اد - ۳ 5 5 
آعز < 7(] 
۸۷ 
2 ار ۳ 1 آُِ 
3 1 ۳ و6 > بد- رز ۱۷/۲6 
5 ‌ د 2 ۵ ِ 
1 


در روابط فوق. :۷ مقدار برآورد شده از مدل, :5 مقدار محاسبه 
شده از شاخص کیفی آب و آ تعداد داده‌ها می‌باشند. 

با استفاده از نرم‌افزار 2016 ۷80 روندنمای مراحل انجام 
تحقیق ترسیم و در شکل ۲ نشان داده شد. 


در پژوهش حاضر برای برآورد مقادیر کمی ۰1۷۵1 از پارامترهای 
1 0۳۱ ۳ دنا من دا ۷۲۵ 16 0 دم ۲۵ و 
4 ایستگاه هیدرومتری باغ کلایه در دوره آماری ۲۳ ساله استفاده 
شد. روش رلیف و همبستگی برای انتخاب ترکیب‌های ورودی مختلف 
به کار برده شد. مدل‌سازی برای برآورد مقادیر کمی ۱۷۵1 با روش 
درخت تصادفی انجام شد» سپس کارایی رویکرد پیش‌پردازش 


2- 1500] ۱۷62۲ 50۷0۵۲۵ 
3- ۱۷]620 ۸9۹010 ۲ 
4- [۷۲0011160 ۷۷ 118906 1 
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08 تبدیل موجک. و ۳0۸ در جهت بهبود نتایج مدل‌سازی» 
بررسی شد. از بین ۴۲۲ نمونه مشاهداتی» ۷۰ درصد (۲۹۵ نمونه) برای 
آموزش و ۳۰ درصد (۱۲۷ نمونه) برای آزمون در نظر گرفته شد. 
بررسی روند مقادیر عددی شاخص ۰۷۷۵ نشان داد که این 
آن. کیفیت آب شرب ایستگاه مورد مطالعه کمتر شده است. پس از 
مقدار هدایت الکتریکی باغ کلایه نیز روند افزایشی داشته و در نتیجه 


میزان شوری آن به مرور زمان» افزايش يافته است. بنابراین یکی از 
آب در نظر گرفت. جهت بررسی چگونگی نوسانات توام شاخص کیفی 
اکسل استت محاسبه و شکل ۲ رسم گردید. نتایج نشان داد که هر دو 
پارامتر از روند نسبی افزایشی برخوردار می‌باشند و این موضوع حکایت 
از کاهش نسبی کیفیت آب با هدف شرب در منطقه مورد مطالعه دارد. 


1 51 101 151 201 251 301 351 1 


جمح‌آوری داده‌ها 
2 011660102 


مدل سازی مقادیر عددی شاخص ۲۷۷٩1‏ 
6 01 ۷۷ ۵۶ ممبلد۷ آدمتمجنه عوصتام۷]۵0 
1 

درخت تصادفی (ع16 00ص2؟۳) 

* رویکرد پیش‌پردازش 1322108 - درخت تصادفی -0ذ۵ظ) 
(۰1۳66 م۴2 

» تبدیل موجک- رویکرد پیش‌پردازش 128810- درخت تصادفی 
(1۳6۵ صصمل‌صم1 -مصنمع2ظ -۷۷2۷۱۵۲) 

مج 


0 ارزیابی 6۳10612 سوه ؟ 


- ضریب همبستگی 00۲۵210108 )صمت‌نله0) 


- ضریب ویلموت اصلاح شده 
م0068 ۲مصصلز ۷۷ 01۶660 ۷۲۵ 


۰-9 ۳ 


شکل ۲- شمای کلی مراحل انجام تحقیق 
۹ ۲۵۹۵2۲0 6ظ) ۵۴ مصنلاه0 -2 اع۲1 


59۰ 


56۳5 6 


۷ ۱ ۱ 
151 201 251 301 351 1 


(طاصمصص مصز 1 
زمان (ماد) 


(۳0۵0) 1۱۳96 
زمان (ماه) 


وش و سناریو 


- ریشه میانگین مربعات خطا ۲2۲0۲ 50۳26 صدع]1۷ 13006 ٍِِ 7 
انتخا : 
- میانگین خطای مطلق ۲۲۵0۲ ۸050106 صدع]۷[ 0 


51 1 


شکل ۲- نمودار سری زمانی هدایت الکتریکی و شاخص ۲۷۲۵۲ 
۲ 60۲ ۷۷ مه ازا رم اهتتاععاه ۵۲ )دص ممزهو مصطرز 1 -3 ۲1۵۱۲۵ 


۵0 0ص 000 


هدایت 


۱00۱۱ 
الکتریکی (میکروموس بر 
سانتی متر) 
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جدول 6- معیارهای ارزیابی برای برآورد مقادیر کمی ]۲۷۵۵ در بخش آزمون 
ماع اعع) 66 دز عم‌ساه۲ ۷۷۵۲ ۷۲۵)ه)ن)ههنو عصتامصتای 10۲ متمانتن صملاهت(۲۳۲۵ -4 12016 


0( 
1-- ۲۷۷ ۱-1 
2 +( 1 ۱ ۰ 3۱/۱ ۱ 
2 2.37 2-11 5 1 2-4 245 
1۱-9۵<2۵95 2.80 6 / 22228۵ 01 
6.- 117 2017 ۵ ۰ 2.34 235 
5 10۵2۵ 217 7 ۰.03 2.32 236 
۵۸ 2-2-2" 206 6 03 2-98۵ 3237 
7 1.48 228 8 ۰.0.5 1.86 2.80 
7 12-329 2.39 8 6 1-4۶ 2.71 
2.6 <- ۵ 1-8 2.14 7 ۰ 7-2 2-15 
6 1.9۵2۳ 2.71 7 5( --1-2" 2.97 
7 1.46 220 58 5 .- 1.85 2.70 
6 1.59 234 8 0.96 1.63 2.45 
7 1.4 220 8 ۲ 1-2-۱3 2-8 
2 »۰ 2.42 216 5 1 2-5 532 
۰-3 2.23 32.21 5 0.87 3.03 38 
0094 2.1 2.16 7 .۰ 2.35 2.39 
6 ۵2-2 1-3 244 ۵8 ظ ۰" 25 214 


در ابتدا برای بهبود نتایج مدل‌سازی با روش 1 از رویکردهای 
پیش‌پردازش ۳2۸82102 و تبدیل موجک استفاده شد. نتایج به دست 
آمده از مدل‌سازی کمی ۷۷۵۵۲ در جدول ۴ آورده شد. 

با توجه به جدول ۴ نتیحه گرفته شد که استفاده از رویکرد 
پیش‌پردازش 1328108 و تبدیل موجک باعث بهبود نتایج مدل‌سازی 
شده است. با توجه به این که رویکرد پیش‌پردازش 2822102 با 
الگوریتم پایه درخت تصادفی, ترکیبی از نتایج چندین درخت تصادفی 
است. بنابراین استفاده از این روش باعث افزایش دقت مدل 1 شده 
است. پس به‌طور کلی نتیجه گرفته شد که استفاده از روش تبدیل 
موجک و دسته‌بندیء باعث افزایش دقت و کاهش خطا می‌شود. 

از بین ترکیب‌های ورودی مورد مطالعه. تمامی ترکیب‌هادقت 
قابل قبولی را داشتند. در روش 11 سناریو ۱۱ شامل پارامترهای 
03 یک بقل بان ,۷۱2 ,۳۱ مق ,90 ,م1 بن۲ بلط با 
۳-6 بالاترین دقت را در برآورد مقدار ۷۷۵ داشته است. با 


6 15 14 13 12 11 10 9 8 7 6 < 4 3 2 1 
سناریو (متتجصععع) 
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5 ۳ ۱۲۸۲ و7 تمصع 
5 090 2:65 3:63 094 1 
3و 089 289 . 421 .۰ 092 2 
5 086 319 485 089 3 
4و مق 277 480 09 4 
5 087 3:06 .۰ 489 . 089 5 
ون نو 260 298 و09 6 
و 090 268 364 م09 7 
6 090 2:68 3277 093 8 
6 091 252 350 094 9 
و 09 26 374 094 10 
و و09 217 290 ۰ 0/96 11 
و 088 29 422 091 12 
6 077 410 744 073 13 
09 081 374 630 082 14 
5 087 303 487 089 15 
56 090 270 .۰ 422 .۰ 092 16 


ترکیب روش 1 با رویکرد پیش‌پردازش 3288188 و تبدیل موجک» 
مقدار 4 به ترتیب برابر ۰۳۷« 9 ۸ شده است که نشان از افزایش 
دقت مدل دارد. بهترین سناریو با بالاترین دقت و کمترین خطا مربوط 
بدا ستاریو ۱ مدل 1-1۲ 1۷۶ با پارامترهای. ,1۳8 :۳0 17[ 
> م2 بلن) ,ع1۷ مد۲16 بن) ٩04,‏ است. نتایج نشان می‌دهد که 
تأثیر 017 در برآورد مقدار عددی شاخص ۷۷۵۵۲ کمتر از سایر پارامترها 
در نظر گرفته می‌شود. سناریو ۱ با یک ورودی (1۳1) دقت بالاتری 
از سناریو ۱۳ با دو ورودی (>1 ,111) داشته است. یعنی تاثیر پارامتر 
1 بیشتر از > بوده است. 

خطای ۷19۳( تمام سناریوهای مورد مطالعه در هر سه روش در 
شکل ۴ نشان داده شد. 


۱ 


0 لد 0 با جح با نب 


جذر میانکین مربعات خطا 


 ۳0۱۱-۵‏ ]2-۲ صت .]۲ سوت 


شکل 4 مقادیر خطای 0( روش‌های مورد مطالعه 
۵6 0۵0۱60۵و 6 ۶ مه ,۱۷۲۹۲ -4 ۲12۱۲۵ 
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همان‌طور که از جدول ۴ نیز مشاهده می‌شود؛ سناریو ۱۰ در 
روش 11 -9 -۷۷ کمترین مقدار ۷15( را دارد که مقدار آن برابر 
۹ است. سناریوهای انتخاب شده با استفاده از روش همبستگی» 
نتایج بهتری از روش رلیف داشتند. می‌توان نتیجه گرفت که وجود 
همبستگی بین پارامترهای شیمیایی تاثیر به‌سزایی در مدل‌سازی 
عددی شاخص ۷۷۵۵۲ دارد. 

یکی دیگر از کارهایی که در پژوهش حاضر برای بهبود نتایج 
مدل‌سازی انجام شد. به کارگیری روش تحلیل موّلفه اصلی بود. به 
کمک روش ۳0۸ موّثرترین ترکیبات خطی از پارامترهای ورودی 
شناسایی شده و به‌عنوان بردارهای ورودی» مورد استفاده قرار گرفتند. 


100 


جر 
‌ 
تغییرپذیری تجمعی (درصد) 
(76) ۱۲۷ا0اه۷۵۲۱ وا نان 


56۲66 ۲ 


1 ۳9 ۳7 ۳5 ۲3 ۲1 
فاکتور (۲۵6۲0۲) 


در نهایت عامل اصلی و تأثیرگذار استخراج شده از ۳0۸ به‌عنوان 
ورودی روش 3۸88108 با الگوریتم پایه 11 در نظر گرفته شد. 
مقادیر ارزش ویژه و حالت تجمعی آن در نمودار ۳10۶ ٩0۲66‏ نشان 
داده شد (شکل ۵). با توجه به این شکل نیز می‌توان نتبجه گرفت که 
از ۴1 به ۳12 با کاهش مقدار ارزش ویژه تأثیر و ارزش عامل نیز کم 
شده است؛ بنابراین عامل ۳۲1 ۲2 و 73 به عنوان مولفه‌های اساسی 

با در نظر گرفتن ۳ عامل اصلی» مدل‌سازی انجام شد و مقدار 
۳-8 1]5۳-2.17 ۷۲۸۳-1.52 و 20.97 به دست آمد. 


مقادیر ویژه ([6۳۷۵۱۲6ع۴۱) 
.لاد نیا نا با 86 


شکل ۵- نمودار ۳۱0۶ ۹6۲66 پارامترهای شیمیایی مورد مطالعه 
021۵206۵ اهتصمصل 60اه عط) ۵ وونل )ما0 مع50 -5 ۲12۱۲۵ 


0 1۷.110 
۷*1 ۸۰-1 
0 11. ۲ 0 
0. 1۲ 10 


٩۱ 


انحراف مساز 


شکل 7- دیاگرام تیلور برای بررسی تأثیر تبدیل موجک رویکرد پیش‌پردازش 19228178 و تحلیل مولفه اصلی 
کلو هه )ری فرصت مضه 0مامصه مصمموظ ممممه اه ما ماهمتامی۲ظ۱ 0) عفن 12۱۵۲ -6 مساهز۲] 


۶ نشریه آب و خاک. جلد ۰۳۶ شماره ۶ بهمن - اسفند ۱۴۰۱ 


همان طور که اشاره شد» سناریوی ۱۰ روش ترکیبی 151 ۷۷-۲ 
و روش ۲۳0۵-8-۲ بالاترین دقت و کمترین خطا را داشتند. برای 
نشان دادن بهتر تأثیر استفاده از رویکرد پیش‌پردازش عحلع3282 و 
تبدیل موجک در سناریو ۱۰ و همچنین تأثیر روش تحلیل مولفه 
اصلی» در شکل ۶ دیاگرام تیلور روش‌های مذکور ترسیم گردید. 
با توجه به شکل ۶ ملاحظه گردید که استفاده از رویکرد 
پیش‌پردازش 3288172 و تبدیل موجک باعث بهبود نتایج درخت 
تصادفی شده است. همچنین در حالت کلی نتایج نشان داد که روش 
۸علی‌رغم کاهش بعد بردارهای ورودی و ساده‌سازی آن؛ می 
تواند دقت و سرعت عملکرد مدل را ارتقا بخشد و به‌عنوان بهترین 
روش برای تخمین مقدار عددی شاخص ۷۷۵01 معرفی شود. 
در شکل ۷ نیز نمودار ویلونی برای مقادیر شاخص ۷۷۵۲ که 
به عنوان مقادیر مشاهداتی در نظر گرفته شدند؛ سناریوی برتر روش 
ترکیبی 3 -۱۷-8 (سناریو ۱۰ شامل پارامترهای ,1۳5 ,۳ ,۳1" 
> بقل بل) ,ع/2 ,11605 ,62 ,504) و روش ۳0۸-3-۲ رسم 


0۸-8-17 


مدل (1ع060) 


۲-۳-0 


با توجه به شکل ۷ برآورد مقادیر حداقل و حداکثر شاخص ۱۷/۵۲ 
در مدل ۳0۸۵-۳-۲ بهتر از مدل ۷۷-۳-۶۲ بوده است. همچنین 
بیشترین فراوانی ۷۷0۵1 (بیشترین عرض نمودار ویلونی) در هر دو 
روش حول چارک سوم تغییر نموده و نزدیک به مقادیر مشاهداتی 
برآورد شده است. 

برای نشان دادن بهتر تغییرات داده‌های مشاهداتی و مدل برتر 
بالایی شاخص ۷۷۵۵۲ را برآورد کرده است. 

بررسی منابع نشان می‌دهد از روش‌های داده‌محور در مدل‌سازی 
کیفی آب به کرات استفاده گردیده و اکثر محققین بر توانمندی این 
مدل‌ها تا کید نموده‌اند. 


شاخص ک 


یفی آب شرب (0701) 


شکل ۷- نمودار ویلونی سناریو برتر روش ترکیبی ۱۷-8-81 و روش ۳0۸-۵۸۲ 
0 ۳۸-1-1۲ 20 0۵0ظ)6: 1 ۲۷۷۲-8-1۸ 0مصتماجصی مه ۵۶ متتجصمیو ]عمها عط) ۵۶ صهععنل مملاز۷ -7 ۲12۱۲6 
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شاخص کیفی آب شرب ۷۷۵۱ 


(۳۱۵۴۲۳) ۲۳96 
زمان (ماه) 
شکل ۸- نمودار سری زمانی داده‌های مشاهداتی و مدل بر تر 
۱۵00 ماه رای مه ع)عل امممتاهمهودان ۵۴ امام مم‌نهو م1 -8 ۲12۱۷۲۵ 


ستاری و جاوبدان. تخمین عددی شاخص کیفی آب شرب با استفاده از روش‌های درختی و روبکردهای ترکیبی موجک و تحلیل موّلفه اصلی ۷۰۷ 


آل مختار و یاسین (2019 ,۷۵5669 -۸۱ 4صه عهنطان۷ -لض) 
ستاری و همکاران (2017 .۵1 6۶ 48211271 ضمن انحام مطالعاتی 
مشابه با مطالعه حاضر در حالت کلی به این نتيجه رسیدند که با 
عنایت به عملکرد مطلوب مدل‌های داده‌محور در مدل‌سازی 
پارامترهای کیفی آب» استفاده از این روش‌ها برای موارد مشنابه قابل 
توصیه است. همچنین سلگی و همکاران (2017  ۸1.,‏ تع801) برای 
تحلیل کیفیت آب رودخانه کارون واقع در غرب ایران طی مطالعه‌ای 
به مدل‌سازی و پیش‌بینی اکسیژن مور نیاریولوژیکی پرداختند. نیج 
تحقیق آن‌ها نان داد که مدل ۹۷3۷ با ضریب تبیین ۰/۸۴ و جذر 
میانگین مربعات خطای ۰/۰۳۳۸ میلی‌گرم بر لیتر عملکرد نسبتا 
مطلوبی ارائه می‌کند. ایشان پس از اعمال تبدیل موجک روی داده 
های ورودی مدل. باعث شدند تا ضریب تبیین افزايش و به مقدار 
۴ و جذر میانگین مربعات خطا کاهش و به مقدار ۰/۰۲۱۰ میلی 
گرم بر لیتر برسد. بنابراین آن‌ها نتیجه گرفتند که ترکیب ماشین بردار 
پشتیبان با تبدیل موجک باعث بهبود نتایج پیش‌بینی مقدار 010 در 
رودخانه کارون می‌گردد. کرباسی و دیندار ( ۲8027 مه 12/0261 
9 نیز برای پیش‌بینی هدایت الکتریکی و نسبت جذب سدیم در 
رودخانه زاینده‌رود مدل‌های شبکه عصبی مصنوعی ۷۲۴ و 02/1۲ 
را به‌صورت تکی و همراه با تبدیل موجک به کار بردن. نتیج به دست 
آمده از تحقیق آن‌ها نیز بیانگر بهبود عملکرد مدل‌ها در اثر استفاده از 
تبدیل موجک بود. همچنان که ملاحظه می‌گردد. با مقایسه نتایج 
یی حاشیر با نبا قعات اتخام بافنه من قوان درافت که 
استفاده از تبدیل موجک و روش‌های داده‌مبنا نتایج قابل قبولی در 
بررسی کیفیت آب‌های سطحی داشته است. تفاوت تحقیق حاضر با 
سایر تحقیق‌های انجام شده در انتخاب نوع پارامتر هدف مورد مطالعه 
برای بررسی کیفیت آب بوده است. در تحقیقات بررسی شده فوق 
پارامترهایی از جمله اکسیژن مورد نیاز بیولوژیکی. هدایت الکتریکی و 
نسبت جذب سدیم با استفاده از روش‌های داده مبنا مدل‌سازی شده و 
تاثیر تبدیل موجک در بهبود نتایج مورد بررسی قرار گرفته است؛ اما 
در این پژوهش ابتدا شاخص کیفی آب با استفاده از ۱۲ پارامتر 
شیمیایی محاسبه شده و سپس با روش‌های داده‌مبنا مدل‌سازی شده 
و همانند تحقیقات مشابه فوق‌الذکر تأثیر تبدیل موجک در بهبود نتایج 
مورد ارزیابی و تاکید قرار گرفته است. 


نتیجه گیری 


منابع 


در پژوهش حاضر کیفیت آب ایستگاه هیدرومتری باغ کلایه 
مورد بررسی قرار گرفت. برای طبقه‌بندی کمی آب از ۱۲ پارامتر 
شیمیایی شسممل 0۳۱ ۳ 115 2 2 2۷۵ 16 1 دم 
00 و ۹04 در دوره آماری ۲۳ ساله در سناریوهای مختلف 
استفاده شد. ابتدا مقادیر کمی شاخص ۷۷۵۲ محاسبه شد. پس از 
بررسی روند مقادیر عددی شاخص ۰۷۷۵۲ مشسخص شد که این 
شاخص, روندی افزایشی داشته و در گذر زمان با افزایش مقدار عددی 
آن» کیفیت آب شرب ایستگاه مورد مطالعه کمتر شده است. با توجه به 
روند افزایشی هدایت الکتریکی در ایستگاه مورد مطالعه» نتیحه گرفته 
شد که افزایش شوری آبه می‌تواند به‌عنوان یکی از دلابل کاهش 
کیفیت آب در نظر گرفته شود. برآورد مقادیر عددی شاخص ۷۷۵۲ با 
استفاده از روش درخت تصادفی انجام شد؛ همچنین تأثیر استفاده از 
رویکرد پیش‌پردازش 1322178 تبدیل موجک و تحلیل مولفه اصلی 
در بهبود نتایج بررسی شد. ارزیابی روش‌ها با آماره‌های ضریب 
همبستگی» ريشه ميانگین مربسات خطاء مبانگین خطای مطلق و 
ضریب ویلموت اصلاح شده انجام گرفت. نتایج به دست آمده از 
پژوهش حاضر نشان داد که استفاده از رویکرد پیش‌بردارش 
222108 تبدیل موجک و ۳0۸ در بهبود نتایج و افزايش دقت. 
تأثیر مثبتی داشتند. در برآورد مقادیر عددی شاخص ۰۷0۵1 روش 
۲ - ۳0۸ با در نظر گرفتن ۳ عامل اصلی, بالاترین دقت را 
داشت. با توجه به این که تمام روش‌های مورد استفاده در برآورد 
مقادیر کمی » دقت قابل قبولی داشتند. لذا در صورت کمبود داده و 
عدم دسترسی به تمام پارامترهای شیمیایی» می‌توان با استفاده از 
تعداد محدودی از پارامترها و روش‌های داده‌کاوی» نتایج مناسب و 
قابل قبولی را به دست آورد. با توجه به محدودیت تهیه داده و 
محدودیت صفحات. این مطالعه روی یک ایستگاه انحام گرفته است. 
جهت ارزیابی‌های دقیق‌تر, مطالعه روی ایستگاه متفاوت با طول دوره 
آماری زیاد منجر به نتایج جامع‌تر و کامل‌تری خواهد شد. این مطالعه 
در اقلیم خشک و نیمه‌خشک انجام گرفت در حالی که مطالعه روی 
اقلیم‌های متفاوت باعث ارائه نتایج تکمیلی می‌گردد. امکان استفاده از 
همه مدل‌ها از جمله مدل‌های یادگیری عمیقء برنامه‌ریزی بیان ژن و 
مقایسه آن‌ها وجود نداشت. لذا پیشنهاد می‌شود در مطالعات بعدی؛ 


این روش‌ها نیز مورد توجه قرار گيرند. 
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۵۵ .۵010065 عصتصتحط م24 عصنعدا اصمصصووهووه امین مه مصنامری 2013(۰) نب رتعل‌مطوعو عک ریک بتللمک . 


39-۰ :(26)15 ۸۵۴۵/6۵05 ۵۱۱۴۵۸۵۸۵ 0۴ ۱1۱۵ ول 


165 معلقصه مه اما رزم]فصه )م۵2۷۵ عصتم ممتامعاع لقصونه مامتان .(1995) ۲۰۷۰ ,وطمه۷۷ » ریک رتاش . 


2391-0۰ :76 5062 ۷6۱۵۵۲0089661 ۱۱۱۵۲۱6۵۲۲ 16 0۴ ۱0/21ظ رعطله 


مصه)‌تهونه 0 ممتاه‌تکلووهاه 40صه ممتام۲۲۵0۲ 2013(۰) .9 پطام۱۷۲۵۵012۵0 مصقصهل‌طادظ ی و.] بطعقصع! ر.ت) بصفل .لا ,۵۷ ۷21 . 


154-۰ :(5)2 ۲ ۲۱۱۵1۱۱2618۵ کورره/کردهاظ .60هص1 تقمط 0۲۲9۷۵۷۵طو صرح ماطالوا۷ منوا توعد لاو وم 0عقهه ۳ 


۵ )2۵ نا ظ1 و1۳۷۵ ت0زمحظ رم ممتاهناله رمص1 زاتلمتان بعاه ۷۷ .(2020) هر رتم۱ ی ,9.۷ بتصقامطلا . 


.-1356-020-10509 10۰1007/91 /۳۸۲0://001.0۲2 ۰ 63523-63531 :28 61 ۵6:660۲ 0ی ]01 00 566۱۱6۵ 


وش ,9010192461 ب. متفه بط مصعله بیط بله۲ رعطا۱۷ ,.۲ ,160 بظ بطم ۷ مهو ۷ بطتلامفهاظ .۲ محفصطان .. 


۰ ماامرصا گه تعحاصصبنط تمحصتصتصه ه مصایمل تقوم ممتامن0عتم »رعصا واتلهندن ماج ۲۱۷۵۲ اصمزم۲ظ .(2020) هر رع1/ه 
.751-3۰ :(14)1 ۱۳/۱2۵ 9 9 9 را ۳۰۲۶/۱ 8( 
19942060-02۰ 10۰1060/7 /۱)۲05://001.0۲2 


۵ ۶ 0۱۱0۵117 عظ) عصتام‌ت0عنم طا عصتصنص ماج ۵۶ عویا 16 2017(۰) ,1۷۲ ,تامطووه‌۸9 ع ریک رلفه۱۷۲1200 ,.۷۲,1 بتتهتاهه . 


(۳۵۲۹1۵0 18) .407-419 :(402 ما2۵ ومع ۰(صعطوو ۵۶ وعمملو ممطرمظ مط ۵۶ وتعتدر مطا :ررلناو عقهع) کمه۳ 


85 ,۱۷۱۵2۲2۹۳0۲2۵ رقصیاظ ۵۶ وه۲۱۷ عمزقحظ مصصرمی ۵ رع4ص راتلدتان عادته مطا چم وعتل‌بتاو. ,(1992) .1۲۲.۳۲ بطعطاه . 


61-۰ :1 «وهاها۶ ۱۱۷۱۲۵۱۵۱۱۵۵ ۸6۵02 


0 عصتصنط ماه عع9 مومع ]له ۵۶ ممتاه‌تانم۸ 2018(۰) .ظ بتاه۲۱۵02۷ ع را مطهطافع]۱۷ ,9.۸ رتاهمصفصتهاود . 


۴ 01۳0۷1۵6۵(۰ ۳2۲5 رصتقام مممتممقک1 :ناو عقهع) قعمامع اتلمتان ماد ممتاصتیل نامه ]محر فص فصتحصعاع 
(اعحتاوطاه طفتاعصظ از صهوع۲ 18) ,۱-14 :(1) ۲ ۵۱۱۱۱۵ ۵ 0۴۵1 ۱۱۵ ول 


(«ا0ظ) 0محفصمل ممعوره آهمتومام1ه )فهع۲0۲6۵ صه عصنام۱۷]00 2017(۰) ۲۱۰ اتف ع بیط ملع227 ۸ ملطع۲00۲۵ ری رلع901 . 


8٩6-۰‏ :(1) 31 60 ۵700 ۲۷۷۵۸۵۲ ]۵ ۱۲۵ ول حصمقصها ۷۵۷۵۱۵ ۱۷۱ مصتطمممط عمامع۷ ]0۲هجناو ممتامصطاصمع مصتود 


مهم صماهع 1 مصتامت0عتم طا دام0مصه مصتصوع1 مصتطممصه مصتماندظ (2022) .9 بل [۳۱20 عک روط بلفاه1120 . 


۰ ]6۱05/۵/۱۵ بحلفلصتاآ.. مصتفحظ . معبنک . ۷608۵0 . طا. مصل‌لفهه . ممتفتعع0 .. 6160۷۵ . 1۵۲ . وممنصا. «اتلهتان 


مب و 


ستاری و جاوبدان. تخمین عددی شاخص کیفی آب شرب با استفاده از روش‌های درختی و روبکردهای ترکیبی موجک و تحلیل موّلفه اصلی ۷۰۹ 


1۰ و( 

۳ 1۱۵8 01۵ ۱۱66۵1 0۴ 0۱۱001 ۷۷۵۷۵۵ ۳۵۵۲ 2021(۰) بخ ر2 ۷۷ رل ,تقحصتنک حفمطها ,۷۰ مطاممه/7 ۷19۳ .27 
1۰ ۲۵161۱18 ۱۵۵۳۱۵۵۲ 6 09۵ ۱۱۵0۳۵8۵ ۱۵0 ۵ 0۴ 0 تا ۵ 60۷۲۵۵ ۱۱۵ و10 6015 
۰ .]۰.0201۴ [/۵۵5://001.0۲82/10.1016 4۱ وع1)مصصعط)۱۷]2 0عنام۸ ما مصمتعاوظ اهتاجمبم]1۱11 مناد 


